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Предложена архитектура ѴѴеЬ-портала на основе использования базовой подсистемы по работе с семантикой информационных 
объектов. Данная подсистема реализует работу с онтологической моделью и семантическими метаописаниями всех объектов 
портала, содержащих знания, что позволяет решать задачи по работе с контентом объектов. 


Введение 

В настоящее время активно развиваются подход 
по управлению знаниями организаций [1]. Данный 
подход содержит как организационные методы по 
активизации создания знаний, по распростране- 
нию и использованию знаний, так и информа- 
ционно-программное обеспечение, которое хотя и 
является не достаточным, но весьма необходимым 
компонентом. В современных системах управле- 
ния знаниями множество функциональных компо- 
нент объединяется в порталы управления знания- 
ми [2, 3], которые, в качестве основных, включают 
такие подсистемы, как: база знаний профилей ком- 
петентности экспертов и сотрудников компании, 
поддержка коллективной работы сотрудников и 
экспертов, формирование структурированного ар- 
хива документов (библиотеки) и пр. Применение 
семантических технологий [4] в разработке порта- 
лов управления знаниями позволит выполнить их 
реализацию на качественно новом уровне. Данный 
подход основывается на использовании единой 
модели знаний о предметной области организации, 
согласовании на основе этой модели описаний раз- 
личных объектов содержащих знания (документов, 
профилей компетентности и т. п.), поддержке пер- 
сонализации базы знаний для разных пользовате- 
лей, повышении точности распространения и по- 
иска требуемых знаний. За счет этого могут быть 
преодолены многие из существующих барьеров 
распространения знаний. 

Современные ѴѴеЬ-порталы 

В области информационных технологий порта- 
лами называют информационно-программные си- 
стемы, размещенные в компьютерной сети (\УеЪ- 
приложение) и являющиеся унифицированным 
средством доступа к набору информационных ре- 
сурсов и функций, необходимых определенному 
сообществу пользователей. Порталы расширяют 
понятие \УеЬ-сайта. Если \ѴеЬ-сайт - это набор ло- 
гически взаимосвязанных страниц, доступных по 
протоколу НТТР, то портал - это \ѴеЬ-сайт, кото- 
рый предоставляет широкий набор функций, и в 
том числе доступ к разнообразным ресурсам. 

Основными функциями портала является инте- 
грация информационных источников, приложе- 


ний и поиск информации. Функциональность пор- 
тала реализуется на основе некоторой архитектуры, 
которая определяет согласование функциональных 
модулей портала, стандартных систем, используе- 
мых для их реализации и протоколов взаимодей- 
ствия. Обобщенная архитектура современных 
\ѴеЬ-порталов содержит три уровня: интерфейса 
пользователей, бизнес-логики и данных. На уровне 
интерфейса пользователей, как правило, использу- 
ется тонкий клиент (\УеЬ-браузер), способный ви- 
зуализировать графическое представление, опи- 
санное на языке НТ МП Для выполнения некото- 
рых дополнительных действий могут использо- 
ваться и другие приложения (клиент электронной 
почты, К.8$-клиент и т. п.). Для реализации инфра- 
структуры портала применяется ряд широко из- 
вестных программных систем и технологий, на- 
пример, таких, как Місгозой 11$, АрасНе НТТР $ег- 
ѵег, Огасіе АррИсайоп $егѵег. В качестве хранилищ 
данных используются реляционные базы данных, 
доступ к которым осуществляется с применением 
технологий ОДЕОВ, ОБВС, ГОВС и т. п. В качестве 
технологий программирования могут использо- 
ваться такие технологии, как А8Р, А8Р.ЫЕТ, РНР, 
.Г8Р. Визуальное представление описывается на 
языке НТМЕ, который интерпретируется Интер- 
нет-обозревателем пользователя. 

Хотя подходы к разработке и реализации порта- 
лов можно считать достаточно проработанными с 
точки зрения методов и используемых технологий, 
существует объективная необходимость их разви- 
тия. Эта необходимость обусловлена, с одной сторо- 
ны, развитием телекоммуникационных технологий, 
делающих информацию принципиально более до- 
ступной, а с другой, лавинообразным ростом объема 
информации, в которой все сложнее отыскать 
необходимую информацию в заданном контексте. 

Портал является такой информационной систе- 
мой, которая организует унифицированный доступ 
к целевому информационному пространству, и по- 
этому проблема повышения эффективности ин- 
формационных процессов при больших объемах 
информации стоит особенно остро. Одним из под- 
ходов к решению данной проблемы является пере- 
ход на семантический уровень при сборе, обработ- 
ке, накоплении, хранении, поиске и распростране- 
нии информации. 
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Архитектура семантического портала 

В настоящее время активно ведутся научные ис- 
следования по дальнейшему развитию \ѴеЬ-порта- 
лов. Одним из основных направлений этих иссле- 
дований является переход от методов работы с син- 
таксисом к методам работы с семантикой. Методы 
работы с семантикой, и их программная реализа- 
ция, называются семантическими технологиями 
[4). Использование семантических технологий рас- 
сматривается в качестве средства повышения каче- 
ства, адаптируемости и функциональности созда- 
ваемых порталов [5]. 

Порталы, которые используют для реализации 
своих функций семантические технологии, полу- 
чили название семантических порталов. Семанти- 
ческие технологии используют в создаваемых пор- 
талах для реализации различных функций, напри- 
мер, таких как проектирование подсистем портала, 
организация навигации, взаимодействия пользова- 
телей, работы с документами. 

В данной статье предлагается подход к созда- 
нию семантического портала, в котором семанти- 
ческие технологии используются для реализации 
набора базовых функций, составляющих семанти- 
ческую подсистему портала. Архитектура предлага- 
емого семантического портала показана на рис. 1. 
Семантическая подсистема разработана с целью 
описания объектов портала на семантическом 
уровне (в отличие от синтаксического уровня). 

Переход на семантический уровень осущест- 
вляется за счет устранения синтаксической мно- 
гозначности и учета связей между понятиями. Для 
этого семантическая подсистема в процессе обра- 
ботки информации предоставляет возможности 
учета: 


1) Наличия эквивалентных лексических кон- 
струкций (синонимов) в естественном языке. 
Это достигается за счет описания понятий в он- 
тологии множественными лексическими кон- 
струкциями. В результате появляется возмож- 
ность сравнения синтаксически различной, но 
семантически схожей информации. 

2) Иерархической природы понятий, выражаю- 
щейся в виде отношения «класс - подкласс». 
Это достигается за счет использования таксоно- 
мии понятий в онтологической модели. 
Возможности семантической подсистемы ис- 
пользуются для структуризации информации в 
портале и предоставлении ее пользователям. Пред- 
лагаемое семантическая подсистема поддерживает 
следующие варианты использования онтологии: 
аннотирование объектов; семантический поиск; 
формирование списка объектов, связанных с ис- 
ходным объектом; формирование списка объектов, 
семантически близкий к исходному объекту. 

В качестве моделей представления знаний в 
данной работе используются онтологии предмет- 
ных областей [6]. Онтология содержит описания 
понятий предметной области и отношений между 
ними. Онтология определяется как знаковая систе- 
ма 0={С, К, Ь, Р с , Р ІС , Р ІК \, в которой С={с 1 ,...,с„} - 
конечное множество понятий в онтологии; 
К={г ь ...,г т } - конечное множество бинарных отно- 
шений г,(с х ,с у ) между понятиями; 1={1 ь ...,І к } - ко- 
нечное множество лексических меток (словарь он- 
тологии); Р<^СхС, Р с еК - антисимметричное, 
транзитивное, нерефлексивное бинарное отноше- 
ние, являющееся отношением частичного порядка 
на множестве понятий С, Р 1( ^Ьх С и Р ш ^ЬхК - би- 
нарные отношения инцидентности между множе- 



Рис. 1 . Архитектура семантического портала 
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ствами Ь и С, а также Ь и К. Для записи в портале 
онтологических моделей используется язык 
ОЖДЬ [7]. 

В портале имеется большое количество инфор- 
мационных объектов 2)=Ц, . . . , сІ р ], таких как до- 
кументы, сообщения, новости, адреса ресурсов, 
профили пользователей, описания функциональ- 
ных сервисов и т. п. Элементы онтологии использу- 
ются для описания семантики информационных 
объектов в виде семантических метаданных. Се- 
мантические метаданные для объекта Д предста- 
вляют собой: М{а)={{Хт л ,к л ),...,{{т, г Х])}, где 
іг '<%/) . - триплет; ОЛ- субъект в трипле- 
те; р^КСА - предикат в триплете; о^еСиЮУ - 
объект в триплете; ^е(0,1] - коэффициент, обоз- 
начающий релевантность триплета Ц объекту 4- 

Для записи в портале онтологических моделей 
используется язык КЭР ( Кезоигсе Ое/тШоп Рга- 
темюгк) [8]. Использование онтологий и семанти- 
ческих метаданных позволяет определить семанти- 
ческую (смысловую) близость объектов портала. 
Для этого могут быть использованы методы оценки 
семантической близости элементов онтологии 
[1, 9]. Для автоматического определения положе- 
ния элементов в таксономии используются алго- 
ритмы автоматического вывода в модели дескрип- 
тивной логики ШІС)(В п р, т. к. дескриптивная ло- 
гика является базовым формализмом описания он- 
тологий на языке 0\УЮЬ [10]. На основе оценки 
семантической близости различных элементов ме- 
таданных разработаны методы расчета семантиче- 
ской близости метаданных 5М (М(с1<), Д/Ц)). 

Состав и структура семантической подсистемы 

Функциональность семантической подсистемы 
по работе с онтологиями расположена в сервере 
онтологий, а функциональность по работе с семан- 
тическими метаданными - в сервере семантиче- 
ских метаданных. Сервер онтологий - это отдельно 
функционирующее приложение, хранящее множе- 


ство онтологий и предоставляющее к ним доступ. 
Сервер онтологий используется различными при- 
ложениями, которым нужны различные функции в 
процессе реализации жизненного цикла онтоло- 
гии: создания, оценки, использования и последую- 
щей актуализации. Для реализации в семантиче- 
ской подсистеме выбранных вариантов использо- 
вания онтологии, сервер онтологий предоставляет 
следующие функции: хранение онтологий; извле- 
чение онтологий; логический вывод; поиск в онто- 
логии запрашиваемых понятий и отношений. Сер- 
вер семантических метаданных - это отдельно 
функционирующее приложение, хранящее семан- 
тические метаданные, предоставляющее к ним до- 
ступ и обрабатывающее их. Для реализации вы- 
бранных вариантов использования онтологии сер- 
вер семантических метаданных, тесно взаимодей- 
ствуя с сервером онтологий, предоставляет следую- 
щие функции: составление семантических мета- 
данных; хранение семантических метаданных; из- 
влечение семантических метаданных; сравнение 
семантических метаданных. 

Созданные с помощью функций семантической 
подсистемы онтологии предметных областей и се- 
мантические метаданные объектов семантического 
портала используются при обработке объектов. 
При аннотировании устанавливается соответствие 
элементов информационного описания объектов 
семантического портала с элементами онтологии. 
Результатом аннотирования являются семантиче- 
ские метаданные объектов семантического порта- 
ла. Семантические метаданные являются основой 
для реализации трех других функций семантиче- 
ской подсистемы. 

Возможность определения семантической бли- 
зости позволило разработать методы решения та- 
ких задач семантической подсистемы (рис. 2) важ- 
ных для работы порталов, как: 

• семантический поиск на основе близости се- 
мантического запроса С=(< 7 іЛ< 7 2 л...л< 7 „), где 
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^^=(з і , р„ о), и семантических метаданных всех 
информационных объектов портала. 

• классификации информационных объектов в 
соответствии с набором рубрик на основе се- 
мантических описаний рубрик библиотеки 
Н=(И 1 лН 2 л...лН„), где /г,= р ь о,) и семантиче- 
ских метаданных всех информационных объек- 
тов портала. 

• рекомендаций пользователям портала на осно- 
ве семантических описаний метаописаний про- 
филей пользователей ІІ=(и 1 ли 2 л...ли„), где 
и г($пРпОІ) и семантических метаданных всех 
информационных объектов портала. 

Для выполнения семантического поиска ин- 
формационных объектов необходимо наличие се- 
мантических метаданных у объектов и представле- 
ние поискового запроса пользователя с помощью 
элементов онтологии. Поиск выполняется путем 
сравнения семантических метаданных с запросом. 
Объект считается релевантным запросу в том слу- 
чае, когда в его семантических метаданных содер- 
жаться все элементы из запроса или подклассы эт- 
их элементов. Таким образом, при поиске учитыва- 
ется иерархия понятий предметной области. Функ- 
ция формирования списка объектов, связанных с 
исходным объектом в семантическом портале мо- 
жет иметь различное применение. В разработан- 
ном семантическом портале на ее основе реализо- 
вана категоризация. Для выполнения категориза- 
ции объектов с учетом их семантики необходимо 
наличие семантических метаданных у объектов и у 
категорий, к которым нужно отнести объекты. 
Предполагается, что все множество возможных ка- 
тегорий будет иерархически упорядочено. Катего- 
ризация выполняется путем сравнения семантиче- 
ских метаданных объекта и категории. Объект счи- 
тается относящимся к категории, если в его семан- 
тических метаданных содержаться хотя бы некото- 
рые элементы из семантических метаданных кате- 
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тории или подклассы этих элементов. Очевидно, 
что объект может быть отнесен к одной или более 
категории. 

Функция формирования списка объектов, се- 
мантически близких к исходному объекту также 
может иметь различное применение в семантиче- 
ском портале. В разработанном семантическом 
портале данная функция использовалась при реа- 
лизации рекомендаций. Функция рекомендации 
заключается в предоставлении пользователю 
объектов, похожих по содержанию на некоторый 
объект, фигурирующий в запросе. Выполнение по- 
иска похожих объектов осуществляется на основа- 
нии сравнения семантических метаданных объек- 
тов. 

Заключение 

Спроектированная семантическая подсистема 
портала была программно реализована на плат- 
форме Місго 80 Й.№і с использованием языка про- 
граммирования С# и технологии .Ыеі Кетоііщт В 
качестве модуля выполнения автоматического вы- 
вода в моделях дескриптивной логики, соответ- 
ствующих онтологиям предметных областей, ис- 
пользована система ВАСЕК] 1 1]. С использованием 
созданного программного обеспечения было вы- 
полнено тестирование разработанных методов, ко- 
торое показало высокий уровень формальной пол- 
ноты и точности всех алгоритмов поиска, катего- 
ризации и рекомендаций. 

Разработанное программное обеспечение се- 
мантической подсистемы апробировано в процессе 
разработки и внедрения двух семантических \ѴеЪ- 
порталов различного уровня: портала «Реігоіеит 
Егщіпеегх Ѵігіиаі №і\ѵогк» совместного российско- 
шотландского подразделения Томского политех- 
нического университета и портала поддержки кор- 
поративной системы управления знаниями компа- 
нии «ЭлеСи» (г. Томск). 
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